热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ICCV2019|可变形曲面跟踪,亮风台新出基于图匹配的方法

点击我爱计算机视觉标星,更快获取CVML新技术今天跟大家分享一篇ICCV2019跟踪的论文:DeformableSurfaceTrackingbyGra

点击我爱计算机视觉标星,更快获取CVML新技术


今天跟大家分享一篇ICCV 2019 跟踪的论文:Deformable Surface Tracking by Graph Matching,国内AR(增强现实)公司亮风台提出使用基于图匹配的可变形表面跟踪算法,能够充分探索可变形表面的结构信息,显著提高跟踪性能。

该文作者信息:

作者来自亮风台公司、北京交通大学、Stony Brook University。

所提出的方法通过图结构之间的成对投影误差解决了特征对应和形状恢复问题,并采用软匹配松弛来提高计算效率。

与现有先进算法进行广泛比较后,实验结果表明,新方法可以对不同类型纹理的曲面实现稳健的跟踪结果,并且在跟踪精度和计算效率方面一般优于其它算法。

新提出的基于图的可变形表面目标的跟踪算法,主要贡献在三个方面:

  1. 通过软匹配松弛和精心设计的候选匹配滤波策略,将图模型和图匹配引入到可变形表面跟踪中; 

  2. 设计统一的优化框架,探索局部外观,空间关系和变形模型的全部信息,以获得准确的形状重建; 

  3. 构造了一个带有注释的新的真实世界数据集,用于在不同类型的纹理的情景中评估可变形表面跟踪算法。 

以下为论文的详解:

1. 综述

该文解决了跟踪具有已知初始3D形状(即模板)的通用可变形表面目标以及在单眼透视投影下在视频序列中恢复其3D形状的问题。模板可以被提前手动提供,或者使用从运动中恢复形状的方法从视频序列的数帧中计算模板。

与通常分别处理特征对应关系,去除异常值和形状重建的传统方法不同,该文将这些过程集成到一个统一的基于图的框架中,并提出迭代地解决求解对应关系和求解变形的优化问题。

考虑到计算效率,该文将传统图匹配问题中的强匹配约束放宽到松匹配约束。这种松匹配约束使该算法能够保持更多匹配细节,从而产生更精确的形状,并且通过在软匹配约束下开发的新颖匹配算法也极大地提高了计算效率。

伴随着精心设计的候选匹配过滤策略,该文的基于图的方法能够在几秒内处理数千个点,这比传统的基于图的算法快得多。

为了进行全面评估,该文将提出的方法与几个最近提出的方法在两个数据集上进行比较:

一个是提供的跟踪存在遮挡的表面(TSO)基准,包括存在目标被遮挡现象的两个视频序列;

另一个是新收集的数据集,包括使用不同表面在显著形变的条件下记录的11个视频序列,其中这些目标具有丰富,不明显或重复的纹理。 

实验结果表明,该文的方法可以为所有视频序列提供最佳或近乎最佳的跟踪结果。在计算效率方面,该文的方法在两个数据集上的表现也通常优于参与比较的算法。

(CV君:由于微信不支持公式插入,故以下内容使用图片展示)

4. 实验

4.1. 新收集的数据集

最近,几个数据集被提供来用于评估可变形表面目标的跟踪。但是,它们中的大多数缺少带注释的真实结果(groundtruth)网格顶点。

而且,这些数据集是使用非常有限的表面类型的目标收集的,不足以评估可变形表面目标跟踪算法的有效性。

为了全面评估所提出的算法与基准算法的比较,该文创建了一个新的数据集用于可变形表面跟踪,称为可变形表面跟踪(DeSurT)。

使用Kinect相机收集此数据集,以评估各种变形和不同光照条件下的跟踪性能。它包含11个视频流和3,361个帧,显示几种不同类型表面的各种变形,包括七种不同内容的打印图像(分别是校园,砖,布,鹅卵石,景色,石头和日落),两个报纸和两个靠垫。

如图所示,这些表面大致分为三类:

(1)纹理良好的表面,包括校园,鹅卵石,景色,报纸1,报纸2和坐垫1;

(2)重复纹理表面,包括砖,布和垫子2;

(3)弱纹理表面,包括石头和日落。

 

为了评估重建精度,该文使用Kinect点云来构建真实网格,并计算从重建网格到真实网格中顶点到顶点的平均距离

因此,除了每个帧的深度信息之外,所有视频都在每帧中有手动标注的真实网格顶点(打印图片和报纸中使用130个顶点标注,坐垫用121个顶点标注)。

为了测试所提出的算法对遮挡的鲁棒性,该文还报告了算法在公共数据集(跟踪具有遮挡的表面(TSO)上的跟踪结果,这个数据集包括两个分别有着纹理良好和纹理不良的可变形表面目标的视频流,总共394个帧,并且数据集中存在人为和现实的遮挡。

4.2 结果比较与分析

在本节中,该文报告了所提算法与几种最先进的基线算法的比较结果,包括DIR,LM和LLS:

LM采用SIFT匹配进行特征对应,然后进行迭代异常值拒绝步骤,然后通过求解线性系统重建形状,该线性系统是使用扩展的拉普拉斯形式从退化的线性系统转换而来。

LLS仅关注形状重建步骤,并将关键点对应关系作为输入。在该文的实验中,(在异常值拒绝之后)使用从LM派生的关键点对应作为LLS的输入。

DIR是一种基于像素的方法,采用密集模板对齐进行形状重建。它在很大程度上取决于形状的初始估计,该文将其初始化为上一帧的解。

文中固定并分别公布了N=1000和N=2000两组实验结果。

1. 平均跟踪误差(mm)

2. 平均计算时间(s)

如表1所示,该文的算法对于具有丰富,弱或重复纹理的不同类型的表面是鲁棒的,并且即使在从每个表面提取相对较少的关键点(N=1000)以构建对应关系时也显着地优于所有基线算法。

对于遮挡表面(TSO数据集),DIR在精心设计的遮挡检测策略的帮助下实现了最佳跟踪结果。

有趣的是,在没有任何指定的遮挡表面过程的情况下,该文的算法在TSO数据集上达到了与DIR相当的结果,并且一般优于LM和LLS。当将N上升到2000时,该文的算法的跟踪精度在两个数据集上都得到了显着的改善。

考虑到计算时间(表2),DIR在两个数据集上都是最耗时的。该文的算法在N=1000时在两个数据集上击败其他算法。

当将关键点的数量增加到2000时,在TSO数据集上仍然是最有效的,但在DeSurT数据集上比LM慢。

图3至图6表明了由被比较算法提供的各种类型表面跟踪的几个代表性样本。对于结构良好的表面(图3),所有算法都能够提供合理的跟踪结果,但该文的算法可以更好地处理细节。

如图4和图5所示,所有比较的基线算法都受到弱纹理和重复纹理化表面的影响,但该文的算法能够在帧间提供准确的跟踪结果。

此外,该文算法以及DIR对于遮挡是稳健的(图6),而LM和LLS在存在一定程度的遮挡时可能无法跟踪到对象。

 

论文地址:

https://www3.cs.stonybrook.edu/~hling/publication/deformable%20surface-19.pdf 


数据链接:

https://www3.cs.stonybrook.edu/~hling/data/DeSurT.rar (~2G)

因为之前工作相关,对亮风台这家公司还是比较了解的。亮风台是国内为数不多的持续深耕AR底层技术的公司,之前52CV也报道过他们的技术。

他们围绕AR开源了不少算法:包括图匹配算法(PAMI 2018a),2D AR跟踪算法(PAMI 2018b),投影补偿算法(CVPR 2019),单目标跟踪算法(ICCV 2017、CVPR2019)等等。

相信研究跟踪的同学肯定也了解一些他们曾经发布的数据集,TC-128,POT-210,LaSOT。其中TC-128是国际上第一个彩色跟踪评测集,POT-128是目前国际上最大的AR跟踪数据评测集,LaSOT是目前国际上最大的单目标跟踪评测集。


视觉跟踪交流群

关注最新最前沿的目标跟踪、AR跟踪、曲面跟踪技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:跟踪)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉



推荐阅读
  • 自学编程与计算机专业背景者的差异分析
    本文探讨了自学编程者和计算机专业毕业生在技能、知识结构及职业发展上的不同之处,结合实际案例分析两者的优势与劣势。 ... [详细]
  • 从零开始构建完整手机站:Vue CLI 3 实战指南(第一部分)
    本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点,并确保这些内容与实际工作中的需求紧密结合。 ... [详细]
  • 深入解析Android自定义View面试题
    本文探讨了Android Launcher开发中自定义View的重要性,并通过一道经典的面试题,帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识,还提供了实际操作建议。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • 尽管某些细分市场如WAN优化表现不佳,但全球运营商路由器和交换机市场持续增长。根据最新研究,该市场预计在2023年达到202亿美元的规模。 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • 三星W799在2011年的表现堪称经典,以其独特的双屏设计和强大的功能引领了双模手机的潮流。本文详细介绍其配置、功能及锁屏设置。 ... [详细]
  • 本文详细探讨了Java中的24种设计模式及其应用,并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类,帮助开发者更好地理解和应用这些模式,提升代码质量和可维护性。 ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 探讨一个显示数字的故障计算器,它支持两种操作:将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 本文探讨了卷积神经网络(CNN)中感受野的概念及其与锚框(anchor box)的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小,而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]
  • 深入解析JMeter中的JSON提取器及其应用
    本文详细介绍了如何在JMeter中使用JSON提取器来获取和处理API响应中的数据。特别是在需要将一个接口返回的数据作为下一个接口的输入时,JSON提取器是一个非常有用的工具。 ... [详细]
author-avatar
此号我已不再用
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有